Drug Discov Today|量子计算在药物发现中的潜力:早期的行业动态
整个制药生态系统中量子计算已有发展势头。
在调研范围内的21家大型制药公司中,17家有公开的量子计算活动。
在大约260家量子计算初创公司中,有38家正在试图解决制药问题。
活跃在量子计算领域的制药公司分散在全球各地,没有某个地理上的热点区域。
北美的初创企业获得的资金最多,其次是欧洲和亚洲,总金额为3.11亿欧元。该领域大约一半的资金是在2020年筹集的。
在药物发现领域的学术论文中,对量子计算的提及和引用逐年增加,但还没有观察到不寻常的增长速度。
该领域大多数量子计算的工作都与先导化合物优化和化合物筛选有关。
在进行相对简单的计算时,量子计算还无法提供比经典系统更多的优势。
在药物发现和开发中已有的量子计算的应用的不成熟性,主要是由于硬件限制,这可能会在未来几年内得到解决。
摘要
量子计算(Quantum computing, QC)有望通过执行超级计算机无法胜任的经典任务而彻底改变药物研究。然而,实际有用的量子计算还没有成为现实,尚不清楚QC何时以及是否能够完全解决药物发现领域的实际问题。
我们调研了制药公司、初创公司和学术界在药物发现和开发领域的QC相关活动,结果表明QC已经在所有这些利益相关者群体中形成了牵引力。他们关注与先导化合物优化和化合物筛选有关的QC应用的开发。而且,在充满活力的QC生态系统中存在合作的需求。
前言
量子计算机是一种本质上不同于经典二进制计算系统的计算技术,它利用量子比特(qubits)作为其基本计算单位。与经典比特不是1就是0相比,这些量子比特可以同时拥有多种状态,从理论来说,使得某些操作的计算能力成倍提高(见Box 1)。这些能力允许研究人员在蛋白质折叠和结合亲和力等领域处理高级模拟、优化机器学习(ML)算法。
这些都是最强大的经典超级计算机无法完成的任务。因为随着更多的原子被添加到分子中,复杂性会呈指数级增长,很快就会达到比宇宙中原子数量更多的潜在组合。我们还没有实现实际有用的QC,因为这种技术具有很高的错误敏感性,相干时间非常短(量子位保持叠加状态的时间称为它们的相干时间,相干时间越长,量子位计算复杂问题的能力就越强),而且在制造上普遍很复杂(见Box 1)。
目前仍不清楚QC系统是否以及何时能够解决药物发现中的实际问题。所有类型的量子系统,包括超导量子比特、陷俘离子量子比特和光子量子比特,都处于发展的早期阶段。此外,目前还不知道是否可以利用量子力学的概念来建立一个可靠的QC,以及各种系统中哪一个会占优势。
经典比特可以是0或1,而量子比特(Qubits)则得益于叠加和纠缠的量子力学特性。叠加的量子力学原理描述了一个量子比特如何同时处于多种状态,即0或1或介于两者之间的任何状态,这使得它具有比经典比特存储更多信息的能力。纠缠描述了一个量子比特拥有的相关的能力,即纠缠的状态。这一特性允许量子比特显示出依赖和协调的行为(即使量子比特被距离分开),并带来通过增加量子比特的数量而使信息处理能力成倍增长的能力。这些特性,叠加和纠缠,也是传统的计算操作(用逻辑门表示,如"和 "和 "或")不能应用于QC系统的原因,也是需要开发新方法的原因,即通用的量子算符。然而,这些量子算符的功能取决于量子处理器的基础技术。量子处理器可以基于几种现有的技术,超导、陷俘离子或光子量子比特是迄今为止最常见的,而基于硅、拓扑或中性原子量子比特的系统则不太先进。尽管量子力学特性是量子计算机理论上成倍提高经典系统计算能力的原因,但也是现有技术还没有实现有用的QC的原因。例如,量子比特需要完美的隔离(与外界完美的温度、辐射和冲击隔离),以保持一致性。由于这一条件难以实现,量子比特会随着时间的推移丢失信息,算法也会被破坏。此外,与比特相比,量子比特会受到噪声的干扰,这意味着小的错误加起来会影响计算的质量(这种影响只有在量子比特的数量增加时才会增加)。经典比特使用其状态的副本来纠正错误,但量子力学定律阻止任何数据的复制,因此需要纠错代码。然而,这些代码需要如此多的计算能力,有估计认为(基于基础技术),一个QC高达99%的计算能力需要用于纠正其错误。因此,纠错是可扩展的通用和实用的QC系统的主要限制之一。 无法复制数据也是QC系统不可能进行经典意义上的数据存储的原因之一。每次请求一个特定的结果时,QC都必须进行复杂的计算,因此现有的数据会被覆盖,因为量子比特的高度不稳定状态导致数据快速丢失。这种现象也被称为退相干(开放量子系统的量子相干性,会因为与外在环境发生量子纠缠而随着时间逐渐丧失,这种效应称为量子退相干),是短期内发展实用QC的另一个主要制约因素。科学家们在开发QC系统方面已经取得了巨大的进展,既增加了任何单一系统中的量子比特的数量,又提高了它们的噪声容限、纠错和相干时间。然而,我们离完全耐受噪音的量子计算机还有好几年的时间。预计,噪声中等规模的量子计算机(noisy intermediate-scale quantum, NISQ)将产生第一个有用的应用,它们是可能实现全面量子计算机之前的中间步骤。
第一批能够产生经济收益的商业应用使用非噪声容限(如NISQ)的系统,预计将在未来几年内实现。第一批受益者可能是金融和化学工业。但从长远来看,分析家们预测,制药业将是新技术的最大受益者。
整个制药生态系统中QC已有发展势头
方法
在本研究中,我们将制药公司、细分领域的初创公司和学术机构定义为制药生态系统的核心利益相关者。
为了评估制药公司的QC活动,我们选择了2019年收入超过100亿欧元的全球研发型制药公司来研究。为了调查一段时间内的趋势,我们使用了学术界和初创企业的汇总数据,并通过案例和资金的信息,丰富了这些数据。
为了描述创业公司的活动,我们进行了广泛的在线研究,调研了初创企业的数据库(Crunchbase、Pitchbook、The Quantum Daily、Quantum Computing Report、Quantum Computer List和BiopharmaTrend)和行业会议(Q2B、Inside Quantum Technology、Quantum: Tech and The Quantum Computing Summit),并调研了关于创业公司融资的信息。为了调查学术活动,我们对过去10年中发表的、可通过PubMed获得的同行评议文章进行了结构化的文献回顾。
结果
最大的21家制药公司中,有17家存在公开的QC活动。在大约260家QC初创公司中,有38家正在试图解决制药问题。此外,在2009年以来发表的至少包括一个QC关键词的约3250篇论文中,有42篇经同行评审的论文涉及QC与药物发现和开发。
图1 QC利益相关者群体的地理分布和发展
该图是对制药公司、初创企业和学术界的QC活动的描述,显示了这些不同的群体在QC中活跃的数量,以及初创企业的资金数额、学术界的论文被引用的数量。
(A) QC活动的地理分布
图1 QC利益相关者群体的地理分布和发展
图1A显示了97家机构(来自三个群体:制药公司、初创企业和学术机构)中的地理分布,其中欧洲(36)、北美(35)和亚洲(23)的活动最多。各地区的活动重点各不相同:在欧洲和北美,制药公司和初创企业的活动占总活动的75%左右;在亚洲,学术论文占所有活动的80%左右。然而,我们对亚洲在QC中的低水平活动提出质疑,因为大多数从事QC的中国公司和机构都是国有的,并且不公开他们的活动。之前有报道称获取这类数据困难(特别是对中国而言),这在我们的数据收集中也得到了证实。
在调研选择的样本中,绝大多数的大型制药公司要么公开描述了他们直接的QC活动,要么说明了他们对QC的兴趣。最大的21家公司中只有4家(强生、中国医药集团、吉利德和安斯泰来)没有披露对QC的任何兴趣或活动。活跃在QC领域的制药公司分散在全球各地,没有某个地理上的热点区域。大多数表明对QC感兴趣的活动(如雇用相关人才),都是在过去两年中披露的,但第一个值得注意的事件可以追溯到2017年,当时,Biogen报告了其在该领域的活动。
启示
尽管数据显示,活跃在制药领域的QC初创企业共获得了3.11亿欧元的资金,但一些获得资金最多的企业并不只活跃在这个行业。尽管Cambridge Quantum Computing公司提供了一个名为EUMA的分子模拟的企业应用,但该公司的主要产品是与行业无关的量子开发平台t|ketiTM。第二、第三和第五大获投资公司(分别为Zapata Computing、1Qbit和SeeQC)的情况也是如此,如其网站所述,这三家公司都向制药公司以及金融机构、移动性供应商和其他机构提供产品。
在获得最大资金的五家公司中,只有第四大获投公司Quantum Biosystems(3000万欧元的资金)将其量子排序系统完全集中在制药应用上。图1B中的汇总数据可能表明,投资者对QC初创企业的资助越来越多,对于一些初创企业,特别是那些客户范围广、专注于硬件开发的企业来说,情况确实如此。然而,如果认为这证明了投资者对药物发现中近期商业上可行的应用的期望,那就错了。事实上,大多数专门从事制药行业应用的QC初创公司都没有获得任何资金(公开信息显示),这可能表明它们还没有能够向潜在的投资者展示其商业可行性,或者投资者可能对开发阶段的投资感到犹豫。
大多数QC应用:先导化合物优化和化合物筛选
方法
为了对利益相关者群体进行更详细的评估,我们将每个群体(制药公司、QC初创公司和学术机构)的QC活动分配到药物发现和开发过程中的各个阶段。在这样做的过程中,我们对应用的成熟度进行了评估。
应用成熟度的评估等级包括:等级1(一般性地提到了QC,但没有进一步的细节);等级2(QC基础研究可识别,但直接应用不明确);等级3(QC相关的直接应用正在开发中,但没有对药物发现或开发做出重大贡献);等级4(QC的应用是直接可见的,并且提高了特定过程的速度/质量,即'量子优势');等级5(QC对药物发现/开发做出了重大贡献,这在其他技术中无法复制,即'量子霸权')。
结果
在制药公司群体中,我们看到了明显的分界线:探索QC应用的参与者,采取小步骤探索QC技术但没有披露应用的参与者,以及那些只是一般性地提到他们对QC的兴趣而没有进行任何活动的参与者。拜耳公司在靶点识别或验证步骤中尝试使用QC,他们已经探索了使用QC将病人模型虚拟化和模拟癌细胞增殖的方法。
图2 在药物发现和开发的不同阶段,不同群体的QC活动
该图描述了不同群体的实体机构在药物发现和开发链中的QC活动。每条线代表一个实体机构的信息(收入超过100亿欧元的研究型制药公司,或活跃在制药领域的QC初创公司,或学术机构涉及QC的论文)。圆圈表示该实体机构在药物发现和开发过程中的位置。
我们用1到5的等级来评估各个利益相关者群体的QC应用的成熟度,用圆圈的颜色深浅来表示。
等级1(浅蓝色)是指 "从事QC活动,但没有细节";
等级2(蓝色)为 "QC基础研究可识别,但直接应用不明确";
等级3(深蓝色)为 "QC相关的直接应用正在开发中,但没有对药物发现或开发做出重大贡献";
等级4为"QC的应用是直接可见的,并且提高了特定过程的速度/质量,即“量子优势”;
等级5为“QC对药物发现/开发做出了重大贡献”;
在我们的数据集中,约有三分之一的初创企业被认定为是从事 "QC应用开发"。一个突出的例子是1Qubit,它与Biogen和一家咨询公司合作,在2017年探索了一个分子匹配应用,这增强了Biogen现有的基于量子能力的分子匹配方法。Cambridge Quantum Computing则与两家较小的生物制药公司合作,利用其在量子算法方面的经验,来推动癌症生物标志物的识别。其他实体机构,如ProteinQure、Qsimulate和Menten.ai,专注于量子分子模拟和药物设计的应用开发,在其网站的产品部分有描述。
启示
所有利益相关者群体对先导化合物优化的明确关注,可以解释为QC在模拟和优化问题上的技术优势,如药物与受体相互作用的预测、蛋白质折叠、构象采样以及寻找能量最小值和最大值。分子对接预测的准确性依赖于正确的量子力学计算。随着量子系统以及底层量子相位估计算法和所谓的量子求解器的可用性不断增加,分子对接预测预计将得到改善和拓展。此外,D-Wave系统上的ML算法在简化结合位点预测方面已经显示出初步的成功,其数据量相对较小。然而,噪声和短相干时间仍然是扩大应用的主要问题。由于模拟和优化已经在计算机辅助药物设计中展现出优势,因此,量子计算有望推动当前AI的发展,同时也能减少与物理实验室相关的成本和时间。
筛选引起了人们的高度兴趣,因为量子ML有能力提高虚拟筛选的性能。当与QC能力相结合时,ML不仅可以模拟分子亲和力,而且与经典计算机系统相比,可以以指数级的速度处理大量的数据。已经有一些算法被提出,使得数据库内的字符串匹配搜索大大加快。然而,由于这些方法一般需要存储大数据集,在目前的内存限制下不可能利用这些算法。
制药公司在QC领域相对广泛的活动表明,这些公司对QC非常重视,尽管该技术距离在药物发现中被证实有积极的商业价值还很远。制药公司在采用某些技术方面历来是规避风险的,但大型制药公司正表现出不同程度的兴趣,从纯粹的兴趣声明到建立合作关系,到雇用一系列专家,或授予研究基金。
例如,勃林格殷格翰(图2,Pharmaco #2)、安进(图2,Pharmaco #5)和罗氏(图2,Pharmaco #6)正在建立由药理学科学家、物理学家和计算科学家组成的QC团队,这在各种招聘启事、访谈、Linkedin和他们自己的公司网站上都可以看到;Biogen正在与一家QC创业公司合作,测试QC在分子匹配中的应用;而默克集团(图2,Pharmaco #3)正致力于建立广泛的伙伴关系,尤其在创业领域。
图2中的汇总数据可能意味着初创公司正在引领药物发现和开发中的QC应用开发:我们发现有12家公司展示了进展。然而,完全活跃在制药领域的QC初创公司的风险投资有限,这表明某些初创公司可能夸大了自己的进展。尽管如此,行业合作关系和某些参与者所公布的进展,还是表明了该领域的进展,但很明显,仅靠初创企业也能在药物发现和开发的QC应用方面取得突破。
与制药公司和初创企业相比,学术界侧重于通过将理论量子算法与生物分子应用相匹配来奠定基础,Cao等人、Outeiral等人、Emani等人和Hassanzadeh在他们的文章有所描述。
通过合作来探索制药公司在QC生态系统中的作用
方法
从制药公司的角度出发,我们确定了其在QC领域的合作者,包括特定行业的利益相关者群体,同时也考虑了面向QC应用的与行业无关的组织和机构,如研究联盟和硬件供应商。为了识别和描绘可能的公开关系,我们在网上搜索了各个参与者的公开声明,以及关于合作的新闻和分析报告。
结果
图3 以大型制药公司为中心的量子计算生态系统
我们样本中的大多数制药公司都是研究联盟QuPharm的成员。QuPharm是由葛兰素史克(Pharmaco #11)、武田(Pharmaco #17)、辉瑞(Pharmaco #16)、默克(Merck & Co. , Pharmaco #8)和艾伯维(Pharmaco #4)等组成的一个竞争前的联盟,其成员已经共同开发了20多个QC在制药行业应用的案例。其他跨行业的QC研究联盟,如NEASQC (neasqc.eu)和 QED-C (quantumconsortium.org),其成员中只包括我们样本中的一家制药公司。其他研究联盟,如Pistoia Alliance (pistoiaalliance.org),尽管在该领域的活动已经被证明,但没有任何QC合作分配到制药公司 (由于他们的研究重点超出了QC的范围)。
在我们的样本中,制药公司与38家初创企业中的12家达成了某种形式的合作。
除了Cambridge Quantum Computing和CreativeQuantum公司 (Startup #22)这两家创业公司之外,每家创业公司都有一个公开宣布的与大型行业企业的合作关系。德国默克集团是一家与创业公司合作特别活跃的制药公司。该集团的合作部分是通过他们的创业项目--默克创新中心加速器,通过该项目向SeeQC (Startup #8)投资了400万欧元;部分是通过直接合作,如与HQS Quantum Simulations (Startup #25)或Rahko (Startup #21)的合作。
美国默克公司也通过其默克全球健康创新基金对QC初创公司Zapata Computing (Startup #11)进行了财务投资。然而,大多数制药公司更倾向于非股权研究合作,如安进公司与QSimulate的合作,将该初创公司的高精度分子模拟解决方案整合到安进公司的药物发现过程中;阿斯利康 (Pharmaco #10)与ProteinQure合作,共同设计新型肽类治疗药物;罗氏公司与Cambridge Quantum Computing合作,研究寻找治疗阿尔茨海默病的新药物。
启示
硬件供应商也对药物发现和开发领域表现出兴趣,要么为其潜在的客户确定生命科学领域的应用,要么寻求合作以研究QC和药物发现的交叉点。例如,谷歌的Quantum AI和勃林格殷格翰在2021年的早期宣布了他们的合作。这两家公司将结合他们的科学能力,探索药物发现的分子动力学模拟应用。另一家硬件供应商,量子退火器制造商D-Wave和QC初创公司Menten.ai合作开发混合量子程序,以确定新的蛋白质设计的蛋白质结构。虽然这些联合工作已经公开,但可以预计,领先的硬件厂商正在评估他们的硬件在制药应用中的潜力。
讨论和结论
在理论上声称"量子霸权"没有实际价值。由于量子噪声和短相干时间,QC硬件仍然相对不成熟,是最大的瓶颈。尽管如此,2020年的最新突破引发了在某些点上产生有用应用的希望。
在这个硬件快速发展的阶段,制药企业仍有可能在发展上采取行动,而不至于被已经活跃在该领域的企业打败。加入竞争前的研究联合体或与初创公司合作是一个低风险和容易建立的选择,只涉及有限的财务义务。当然,在制药公司的研究机构内建立一个综合的QC小组可能会带来较高的成本,但也有可能带来较高的未来回报。
最有希望的路径,如在内部建立QC专业技术,建立和支持与初创企业的伙伴关系,或与竞争对手合作等,都有待界定,成功的衡量标准也有待探讨。因此,需要进一步研究,详细探讨生态系统中各个利益相关群体的需求、动机和要求。
ZinnerM, Dahlhausen F, Boehme P, Ehlers J, Bieske L, Fehring L. Quantum computing'spotential for drug discovery: Early stage industry dynamics. Drug Discov Today.2021 Jun 11:S1359-6446(21)00275-0. doi: 10.1016/j.drudis.2021.06.003.
----------- End -----------
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或姓名-学校-职务/研究方向。
Drug Discov Today综述|分子从头设计和生成模型
Nat Comput Sci综述|生物分子建模在技术时代蓬勃发展
AI药物发现公司继续寻求最佳商业模式
利用人工智能和自动化改造药物发现
郭天南|人工智能+蛋白质组学:药物研发的生物学底层变革
Nature:优于联邦学习的医疗数据共享技术Swarm Learning及应用案例
人工智能在药物研发中的应用
Nat Biomed Eng:利用深度学习从抗体序列中预测抗原特异性,优化抗体药物
进入临床试验的AI设计的药物 汇总V1.0
利用量子理论加速药物发现的18家初创企业